27 research outputs found
Automated Implementation Process of Machine Translation System for Related Languages
The paper presents an attempt to automate all data creation processes of a rule-based shallow-transfer machine translation system. The presented methods were tested on four fully functional translation systems covering language pairs: Slovenian paired with Serbian, Czech, English and Estonian language. An extensive range of evaluation tests was performed to assess the applicability of the methods
An MT System Recycled
This paper describes an attempt to recycle parts of the Czech-to-Russian machine translation system (MT) in the new Czech-to-English MT system. The paper describes the overall architecture of the new system and the details of the modules which have been added. A special attention is paid to the problem of named entity recognition and to the method of automatic acquisition of lexico-syntactic information for the bilingual dictionary of the system.
Incorporation of a valency lexicon into a TectoMT pipeline
In this paper, we focus on the incorporation of a valency lexicon into TectoMT system for Czech-Russian language pair. We demonstrate valency errors in MT output and describe how the introduction of a lexicon influenced the translation results. Though there was no impact on BLEU score, the manual inspection of concrete cases showed some improvement
Cesilko Web Service for Weblicht
Weblicht integration of Cesilko (http://hdl.handle.net/11858/00-097C-0000-0006-AAFE-A
Problémy recyklování systému automatického pˇrekladu ⋆
Abstract. Tento článek se zab´yvá problémy, spojen´ymi se snahou vyuˇzít jednotliv´ych modul˚u systému automatického pˇrekladu mezi čeˇstinou a ruˇstinou RUSLAN pro pˇreklad do typově odliˇsného jazyka – do angličtiny. Tato snaha je motivována hypotézou, ˇze pˇres veˇskeré problémy spojené s oˇzivováním p˚uvodního systému, je pouˇzití jeho klíčov´ych modul˚u jednoduˇsˇsí neˇz v´yvoj zcela nov´ych modul˚u. P˚uvodní idea projektu počítala s pouˇzitím dvou klíčov´ych částí sytému, syntaktické anal´yzy čeˇstiny a jeho slovníku. V první části článek pˇredstavuje systém RUSLAN, vyvíjen´y v letech 1985-90 pro pˇreklad manuál˚u operačních systém˚u sálov´ych počítač˚u z čeˇstiny do ruˇstiny. V následující kapitole je rozebrána současná situace v oblasti automatického pˇrekladu z čeˇstiny do angličtiny a je vysvětlena motivace pro recyklaci částí systému. Klíčovou část článku tvoˇrí popis jednotliv´ych součástí systému, včetně nov´ych modul˚u, kter´ymi reagujeme na problémy vzniklé pˇri recyklaci p˚uvodního systému